高分辨率生成

CogView3

CogView3是一款基于中继扩散技术的开源AI图像生成模型，由清华大学与智谱AI联合研发。它通过分阶段生成图像，从低分辨率逐步提升至高分辨率，提高了生成效率并降低了运行成本。CogView3在生成质量和速度上超越了现有的开源模型SDXL，在保持图像细节的同时大幅减少推理时间。其核心特性包括高性能、多分辨率支持及多种优化技术，适用于艺术创作、数字娱乐、广告营销等多个领域。

AI项目与工具 2025年06月12日 47 点赞 0 评论 908 浏览

Matryoshka Diffusion Models (MDM) 是一种由苹果公司开发的创新扩散模型，专为生成高分辨率图像和视频而设计。通过多尺度扩散机制与NestedUNet架构，MDM实现了高效的信息共享与渐进式训练，显著提升了模型的训练效率与生成质量。该模型适用于资源受限的环境，可减少训练步骤并保持生成图像的细节与清晰度。其主要功能包括高分辨率图像生成、多分辨率处理、特征共享以及渐进式训练

AI项目与工具 2025年06月12日 18 点赞 0 评论 737 浏览

Sana

SANA是一个由NVIDIA、麻省理工学院和清华大学共同研发的文本到图像生成框架，支持生成高达4096×4096分辨率的高清图像。它采用了深度压缩自编码器、线性扩散变换器（Linear DiT）和小型语言模型作为文本编码器，并通过优化的训练和采样策略提升了生成效率。SANA在模型大小和运行速度上具备显著优势，适合多种应用场景，包括艺术创作、游戏开发、广告设计和科学研究等。

AI项目与工具 2025年06月12日 11 点赞 0 评论 872 浏览

MDM

Matryoshka Diffusion Models (MDM) 是一种由苹果公司开发的新型扩散模型框架，通过嵌套UNet架构实现多分辨率联合去噪，支持从低分辨率到高分辨率的渐进式训练，显著提升高分辨率图像生成效率，适用于多种应用场景，如数字艺术创作、游戏开发、电影制作等，并具备出色的零样本泛化能力。

AI项目与工具 2025年06月12日 28 点赞 0 评论 658 浏览

OneDiffusion

OneDiffusion是一种多功能的大规模扩散模型，支持文本到图像生成、条件图像生成、图像理解等多种任务。它通过序列建模和流匹配框架实现灵活的图像生成能力，适用于艺术创作、广告设计、游戏开发等多个领域，具备高度的扩展性和统一性。

AI项目与工具 2025年06月12日 59 点赞 0 评论 881 浏览

CogView4

CogView4是一款由智谱推出的开源文生图模型，具有60亿参数，支持中英文输入与高分辨率图像生成。在DPG-Bench基准测试中表现优异，达到当前开源模型的领先水平。模型具备强大的语义理解能力，尤其在中文文字生成方面表现突出，适用于广告设计、教育、儿童绘本及电商等领域。其技术架构融合扩散模型与Transformer，并采用显存优化技术提升推理效率。

AI项目与工具 2025年06月12日 83 点赞 0 评论 881 浏览

Mogao

Mogao是由字节跳动开发的多模态生成基础模型，结合双视觉编码器和先进位置嵌入技术，实现高质量的图像与文本生成。支持零样本图像编辑、多模态理解与生成、高分辨率图像输出以及优化的中文文本渲染。适用于内容创作、智能交互、医疗影像分析等多个领域，具备强大的跨模态处理能力和生成稳定性。

AI项目与工具 2025年06月11日 97 点赞 0 评论 812 浏览

高分辨率生成

首页

高分辨率生成

列表

默认

浏览次数

发布日期

CogView3

Matryoshka Diffusion Models

Sana

MDM

OneDiffusion

CogView4

Mogao

高分辨率生成 首页 高分辨率生成

列表 默认 浏览次数 发布日期

CogView3

Matryoshka Diffusion Models

Sana

MDM

OneDiffusion

CogView4

Mogao

高分辨率生成

首页

高分辨率生成

列表

默认

浏览次数

发布日期